[주의!] 문서의 이전 버전(에 수정)을 보고 있습니다. 최신 버전으로 이동
이 문서는 분류가 되어 있지 않습니다. 분류:분류에서 적절한 분류를 찾아 문서를 분류해주세요!
1. 개요 [편집]
LSM/ADC 서버 BS 작업 시 참고 할만한 체크리스트를 작성 하였다.
2. 작업 중 장애 트러블 슈팅 [편집]
서버 부팅이 정상적으로 안되는 내용은 행업 트러블 슈팅 관련 문서 확인
2.1. LSM/ADC 관련 작업 중 발생했던 장애 [편집]
1. 이중화 기동 및 프로세스, VIP 충돌 현상
- 현상: ADC 서버가 재부팅 된 후 Active 권한을 스스로 가져가 버리거나, 기존 LSM 서버도 Active 상태인 경우다. 이로 인해 두 서버에서 동일한 VIP(Virtual IP)와 프로세스가 동시에 구동되어 IP 충돌 및 서비스 장애가 발생한다.
- 해결:
2. LSM / ADC 절체가 되지 않는 이슈
- 현상: LSM 및 ADC 대개체 후 절체가 정상적으로 이루어 지지 않던 현상이 있다.
- 해결:
- 프로세스 확인: ServiceMonitor 프로세스가 실행중인지 확인[3]
2. 방화벽이 활성화 되어 있는지 확인: 방화벽이 설정되어 있으면 절체가 차단 될 수 있어 확인 후 켜져있다면 비활성화 시켜준다.
(상태 확인)
# iptables -L
# firewall-cmd --state
(비활성화)
# systemctl stop iptables
# systemctl stop firewalld
3. 네트워크 인터페이스 상태 점검 : LSM/ADC 서버의 인터페이스[4]가 정상적으로 UP 되어 있는지 확인 [5] 만약 DOWN 상태일 경우, 아래 명령어로 활성화
# ifconfig <인터페이스 명> up
3. LSM/ADC 서비스 실행 프로세스 및 포트 정보 [편집]
프로세스 및 포트 정보 | |
프로세스 명 | 포트 번호 |
8549 | |
8550 | |
50890 | |
904 | |
911 | |
30000 | |
18079 | |
L_NRM | 18081 |
file_requester | 18084 |
cache_manager | 8081 |
NetIOServer3 | 32128 |
30002 | |
확인 후 추가 | |
4. LSM/ADC BS 작업 체크리스트 [편집]
순서 / 체크 항목 | 명령어 | 기준 값 | 결과 | |
사전 | 서버 공통 체크리스트 점검 | 부팅 전 상태 확인을 위한 점검 | ||
./Server_Check.sh 7 LSM or ADC | 모든 항목이 이상없음 상태입니다. 문구 출력 시 정상 | |||
부팅 후 | 시스템 로그 확인 | tail -F /var/log/messages egrep -i "error|fail" /var/log/messages | Error/Fail 로그 없을 시 정상 | |
서버 공통 체크리스트 점검 | 부팅 후 상태 확인을 위한 점검 | |||
백업 환경 비교 | diff [사전 백업 파일] [현재 상태] | 부팅 전 백업한 파일과 상태가 동일할 시 정상 | ||
LoadBalancer 로그 확인 | tail -F /var/log/castis/lb_log/EventLog_*.log egrep -i "error|fail" /var/log/castis/lb_log/* | "Selected for Client StreamID" 로그가 계속 출력 될 경우 정상 | ||
CiGLBServer 로그 확인 | egrep -i "error|fail" /var/log/castis/glb_log/* | "Successfully New Setup Session" 로그가 지속적으로 출력 될 경우 정상 | ||
LFMServer 로그 확인 | tail -F /var/log/castis/lfm_log/* | 배포 성공(6)이 계속 출력 될 경우 정상 [1] | ||
ADS 로그 확인 | tail -F /var/log/castis/adc_log/* | “[MovieFile::SyncByteCheck] PASSED” 확인 PackLoss가 50% 미만인지 확인 | ||
L_GSDM 로그 확인 | tail -F /var/log/castis/gsdm/*_gsdm.log | "success to alloc" 로그가 지속적으로 출력 시 정상 | ||
동적배포 실패 건수 | egrep -i "error|fail" /var/log/castis/gsdm/* | 3개 이상 시 중앙서버 통신 상태 점검 | ||
큐톤 파일 요청 개수 | cat [GLB_LOG] | grep 'p=c1' | grep RequestFullFileName -c | 요청수와 응답수를 비교하여 검증 | ||
./Server_Check.sh 7 LSM or ADC | 모든 항목이 이상없음 상태입니다. 문구 출력 시 정상 | |||
세션 할당 확인 | lbstat | 대역폭/세션 정상 수치 및 증가 확인 [예시] |
[1] 1.1 1.2 프로세스 리스트 참고[2] VIP 이름은 bond0:1, bond1:1 등 다양하다.[3] # ps ax | grep castis [4] bond0:1, bond1:1, bond1:2[5] ifconfig bond0:1 (각 인터페이스 명 대입)[예시] Ex)
vod40199 Running 2.1139G / 15G [14%] 276 / 3750 [7%] 27.6387T / 30.7235T [89%]
vod40200 Running 2.17629G / 15G [14%] 299 / 3750 [7%] 27.6381T / 30.7235T [89%]
vod40199 Running 2.1139G / 15G [14%] 276 / 3750 [7%] 27.6387T / 30.7235T [89%]
vod40200 Running 2.17629G / 15G [14%] 299 / 3750 [7%] 27.6381T / 30.7235T [89%]